KI in Standardsituationen besser als Mediziner, aber …

In einer Studie der Philipps-Universität Marburg und des Universitätsklinikums Gießen und Marburg wurde untersucht, wie gut 13 öffentlich verfügbare KI-Sprachmodelle klinisches Wissen zur akuten Nierenschädigung abrufen und anwenden können.

Im Frühjahr vergangenen Jahres nahmen 123 Teilnehmer des DGIM-Jahreskongresses in Wiesbaden an einer Studie teil, die untersuchte, wie 13 öffentlich verfügbare KI-Sprachmodelle Informationen zu akuten Nierenschädigungen abrufen und anwenden können. Dabei bearbeiteten die teilnehmenden Medizinstudenten und Ärzte der Inneren Medizin ebenso wie ihre Konkurrenz einen deutschsprachigen Wissenstest mit zwei realistischen Patientenfällen und 15 Multiple-Choice-Fragen.

Das kürzlich veröffentlichte Ergebnis zeigte, dass die KI-Sprachmodelle im Durchschnitt 90 Prozent der Fragen korrekt beantworteten, während die Studienteilnehmer nur 49 Prozent erreichten. Mehrere Modelle lösten alle Fragen korrekt und benötigten dabei deutlich weniger Zeit als die Menschen.

Damit konnte die Studie zeigen: Große Sprachmodelle sind in der Lage, leitlinienkonformes medizinisches Fachwissen in standardisierten Fragesituationen sehr zuverlässig wiederzugeben. Studienleiter Dr. Philipp Russ vom interdisziplinären Institut für Künstliche Intelligenz in der Medizin der Universität Marburg, Universitätsklinikum Gießen und Marburg sieht das durchaus als Chance für den klinischen Alltag, nennt aber auch klare Grenzen: „Sie können unter anderem fehlerhafte Inhalte erzeugen, den Menschen nicht in seiner ganzen Komplexität erfassen und keine Empathie empfinden. Ein Sprachmodell sieht nicht, hört nicht und spürt nicht, worum es einem Menschen wirklich geht. Genau deshalb kann es ärztliches Handeln und klinisches Urteil nicht ersetzen. Richtig eingesetzt könnte es uns aber mehr Zeit für das geben, was Patientinnen und Patienten besonders brauchen: Aufmerksamkeit, Zuwendung und menschliche Nähe.“

Ein gutes Abschneiden im Wissenstest bedeute laut den Studienautoren nicht, dass diese Systeme eigenständig klinische Entscheidungen treffen könnten oder gar sollten. „Menschliches Urteilsvermögen und klinische Erfahrung bleiben entscheidend. Die Letztverantwortung für die Versorgung von Patientinnen und Patienten liegt weiterhin klar bei den behandelnden Ärztinnen und Ärzten“, unterstreicht der Marburger Nephrologe und KI-Experte Prof. Dr. med. Ivica Grgic.

Die Wissenschaftler sehen Künstliche Intelligenz derzeit als hilfreiches, unterstützendes Werkzeug. Allerdings wirft die rasante Entwicklung auf dem Gebiet viele Fragen auf, beispielsweise ob KI autonome Funktionen übernehmen könnte oder überhaupt sollte. Die Studienautoren sehen die Integration in die klinische Praxis daher als schrittweisen Prozess, der einer kontinuierlichen fachlichen, regulatorischen und ethischen Reflexion bedarf.

Maren Kühr

27. April 2026

künstliche Intelligenz

SIE MÖCHTEN KEINE INFORMATION VERPASSEN?

Abonnieren Sie hier unseren Newsletter

KI in Standardsituationen besser als Mediziner, aber …

DAS KÖNNTE SIE AUCH INTERESSIEREN

KI in Pharma und Healthcare: Mehr Wollen als Können

Finanzierung in Österreich: Graph Therapeutics baut Wirkstoffpipeline aus

PathoROB prüft KI-Modelle in der Pathologie

SIE MÖCHTEN KEINE INFORMATION VERPASSEN?

Präklinische Strategie von Veraxa findet Wohlwollen beim PEI

Pre-Seed-Millionen für Schweizer Gentherapiefirma Immitra Bio

Samsung Biologics will Schweizer PolyPeptide für 1,8 Mrd. US-Dollar kaufen

Medical Technology UK zieht in ein neues Zentrum für MedTech-Design und -Innovation

EVENT

Medical Technology Ireland 2026

Mit dem |transkript-Newsletter jede Woche aktuell informiert.

Mit dem kostenlosen |transkript-Newsletter jede Woche aktuell informiert.

KI in Standardsituationen besser als Mediziner, aber …

TEILEN SIE DIESE SEITE

DAS KÖNNTE SIE AUCH INTERESSIEREN

SIE MÖCHTEN KEINE INFORMATION VERPASSEN?